Lernen häufiger Muster aus intervallbasierten Datenströmen - Semantik und Optimierungen

نویسندگان

  • Dennis Geesen
  • Hans-Jürgen Appelrath
  • Marco Grawunder
  • Daniela Nicklas
چکیده

Das Erkennen und Lernen von Mustern über Ereignisdatenströmen ist eine wesentliche Voraussetzung für effektive kontextbewusste Anwendungen, wie sie bspw. in intelligenten Wohnungen (Smart Homes) vorkommen. Zur Erkennung dieser Muster werden i.d.R. Verfahren aus dem Bereich des Frequent Pattern Mining (FPM) eingesetzt. Das Erlernen relevanter Muster findet aktuell entweder auf aufgezeichneten Ereignisströmen statt oder wird online mit Hilfe spezieller, an die Besonderheiten der Stromverarbeitung angepasste FPM-Algorithmen durchgeführt. Auf diese Weise muss entweder auf die Onlineverarbeitung verzichtet oder existierende und bewährte effiziente FPM-Algorithmen können nicht eingesetzt werden. In diesem Beitrag stellen wir einen Ansatz vor, der es ermöglicht, beliebige Datenbank-basierte FPM-Algorithmen ohne Anpassung auch auf Datenströmen durchzuführen. Da unsere Semantik auf der bekannten relationalen Algebra basiert, können weitere Optimierungen bspw. durch Anfrageumschreibungen erfolgen. Wir evaluieren den Ansatz im Datenstrom-Framework Odysseus und zeigen, dass bspw. beim Einsatz des FPMAlgorithmus „FP-Growth“ das Lernen in konstanter Zeit erfolgen kann und somit ein kontinuierliches Lernen auf dem Datenstrom möglich ist.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Data mining with graphical models

Data Mining, oder auch Wissensentdeckung in Datenbanken, ist ein noch recht junges Forschungsgebiet, das als Antwort auf die Datenflut entstanden ist, der wir uns heute gegenübersehen. Es widmet sich der Herausforderung, Techniken zu entwickeln, die Menschen helfen können, nützliche Muster in ihren Daten zu finden. Eine dieser Techniken — und sicher eine der wichtigsten, da sie für so häufige D...

متن کامل

Quantitatives Frequent-Pattern Mining über Datenströmen

Das Aufdecken unbekannter Zusammenhänge zählt zu einer der wichtigsten Aufgaben im Data Mining. Für das Problem des Frequent Pattern Mining über statischen Daten finden sich daher in der Literatur eine Vielzahl an Lösungen. Die Integration von Sensorik in nahezu jeden Lebensbereich führt allerdings zu Datenmengen, welche mittels der klassischen Verfahren zumeist nicht mehr bewältigt werden könn...

متن کامل

Performance-Analyse auf Mainframe-Systemen mittels Profiling

Eine Optimierung der Performance von Anwendungen verbessert deren Laufzeiten und senkt deren Betriebskosten. Um Performance-Optimierungen vornehmen zu können, müssen zunächst Optimierungspotentiale identifiziert werden. Dazu werden Performancedaten erfasst und analysiert. Unternehmensanwendungen, die auf IBM Mainframes betrieben werden, lassen sich mit aktuellen Verfahren allerdings nur umständ...

متن کامل

Typical Patterns of Bone Involvement inWhole-Body MRI of Patients with Chronic Recurrent Multifocal Osteomyelitis (CRMO) Typische Muster des Knochenbefalls in der Ganzkörper-MRT von Patienten mit chronisch rekurrierender multifokaler Osteomyelitis (CRMO)

Ziel: Die Diagnose einer CRMO wird häufig erst nach einer längeren Anamnese gestellt. Wir werteten Ganzkörper-MRT (GK-MRT) hinsichtlich typischer Muster des Knochenbefalls aus und beurteilten deren potentiellen Beitrag zu einer schnelleren Diagnosestellung. Material und Methoden: GK-MRT (1,5 T, coronare STIR-Sequenzen) bei 53 Kindern und Adoleszenten (mittleres Alter 11 Jahre, 4,8–15,1) mit his...

متن کامل

Datenströme im Kontext des Verkehrsmanagements

Anhand mobiler Objekte im Verkehrsmanagement diskutieren wir die Verarbeitung der dabei entstehenden Datenströme. Wir skizzieren typische Anforderungen an Datenverarbeitungssysteme und begründen, warum traditionelle Datenbankmanagementsysteme im Kontext von Datenströmen weniger geeignet sind. Vielmehr motivieren wir den Einsatz von Datenstrommanagementsystemen, wobei wir einen Überblick über al...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2013